导读 智能风控由专家经验和算法化决策组成,是人与系统紧密合作的系统。它为业务服务,需完成公司的战略目的。智能风控依赖于人工和数字两大风控武器,并随着工作深入不断发展和提升。智能风控的原料包括数据、业务和生态底座,需进行数据存储和计算,提炼业务经验,并利用生态资源。
本次分享内容主要包括:1. 智能风控的定义
2. 专家人工系统
3. 数字算法系统
4. 强化学习
5. 大语言模型+知识图谱
6. 对抗学习
7. 图神经网络
8. 案例
分享嘉宾|汪浩然 互联网公司 资深风控和图计算专家
编辑整理|梁维
内容校对|李瑶
出品社区|DataFun
智能风控由两大关键部分组成:专家经验和算法化决策,形成人与系统紧密合作、相互依赖的体系。智能风控服务于业务,旨在实现公司的战略目的,如控制逾期率和资损。为实现这些目的,需要制定具体的战术和打法,运用策略、算法和专家经验。智能风控的基础是人工和数字两大风控武器,随着工作的深入,我们不会局限于武器层面,而是持续进步。智能风控的诞生离不开其原料——数据、业务和生态底座。数据底座需要存储和计算,业务底座则需要提炼业务经验,同时利用生态资源。综上所述,智能风控是一个层次化的体系,涵盖多个方面和层次。
专家人工系统
那么,我们应如何看待智能风控体系中的人工专家体系呢?这是一个时间流上的故事,涵盖了事前、事中和事后三个环节。在事前环节,我们需要对业务进行明确地诊断,识别潜在的风险和漏洞,并确定相应的防控措施,同时筛选出风控的业务对象。进入事中环节,业务进展的互衡、专家规则的制定以及数字算法模型的评审都显得至关重要。这里,人的角色不可忽视,因为即使再好的模型,其有效性也需要人的评审来确认。最后,在事后环节,我们需要对整个过程进行风控评估,处理违规涉案事宜,并追回平台损失。综上所述,在事前、事中和事后三个环节中,人工专家系统都扮演着不可或缺的角色。
数字算法系统
回到数字算法系统,它实际上是一场“魔法对决”,因为随着 AIGC 的普及,伪造、虚假、欺诈、作弊、违规和违法行为层出不穷。我们需要通过算法来识别这些违规和作弊行为。这种对抗愈发有趣,数字算法的运用时代已经到来。传统的风控可能依赖简单的业务数据、规则和逻辑回归等方法。然而,现今已大量使用个体数据、环境数据、行为数据、关系数据和业务数据。算法方面,除了统计回归、时间训练预测、强化学习和深度学习,大模型也发挥着越来越重要的作用。在业务应用领域,这些技术可应用于个人信贷风控、企业信贷风控、电商风控和社区风控等领域。传统方式依赖于业务知识和专家经验进行特征设定、样本收集和统计回归预测。但专家与数字算法系统必将长期共存,互相补充。风控技术有四大趋势:强化学习、大语言模型、知识图谱对抗学习和图神经网络。在人工智能未完全实现的阶段,专家系统和数字算法系统将长期互补。
强化学习
在强化学习领域,算法模型、业务决策以及环境系统之间的交互式学习日益重要。这意味着算法会更多地依赖自身进行学习,以优化风控的算法参数和规则。首先,算法模型生成算法决策,这些决策进一步转化为业务决策,从而产生业务结果的反馈和业务状态的变化。这种变化再反馈给算法模型,形成一个闭环学习系统。随着 AlphaGo 和 ChatGPT 等模型的成功,越来越多的业务方开始认可这种学习方式,并尝试通过它开发出有效的风控算法和模型。与此同时,对模型可解释性和特征可解释性的强调有所减弱。
大语言模型+知识图谱
大语言模型和知识图谱是当代风控领域的重要趋势。大语言模型擅长预测下一个词,对内容识别和信息解锁具有独特优势。因此,算法工程师需要掌握如何将风控问题转化为内容问答模式,这种方法在实践中通常非常有效。风控工作涉及大量数据和知识,尤其在线上线下实体零售交织的当下。为了将这些复杂领域的业务知识、上下游链路关系、业务生态内容以及实体通过网络形式联系起来,知识图谱发挥着关键作用。它不仅是大语言模型的补充,还可以与其进行交互式操作。这两者在未来风控中的角色将越来越重要,但它们需要强大的软硬件支持,如图数据库、人工智能芯片、通用语料、垂直语料以及关系网络数据的收集。因此,为了充分发挥大语言模型和知识图谱的潜力,持续的技术投入和创新将是关键。
对抗学习
另一个重要的方面是对抗学习。在风控领域,我们常常面临风险最小化和收入最大化的博弈。在 min max 框架下,如何通过有效的诊断器来识别欺诈行为和欺诈内容成为关键。此外,信贷额度本身也可以视为风控内容的一部分,它同样是一个博弈过程。在设定风控额度时,我们需要确保风险最小化,同时实现收入最大化。这意味着在生成额度的同时,我们需要进行诊断,以确定是否达到了这一平衡。
图神经网络
图神经网络是一个强大的工具,尤其在风控领域。多年来,图计算与风控的讨论和论坛逐渐增多,表明两者密不可分。实际上,图计算在风控领域的表现远超过其他领域。通过图神经网络这一强大的框架,我们能够有效地将各种数据纳入深度神经网络学习的框架中。这意味着社交网络对象、供应链对象、资金关系对象、职业对象以及地理关系对象都可以被整合到这个体系中,从而最终产生有效的风控决策。
案例
在当前国家强调金融赋能的背景下,供应链金融成为了一个极为热门的领域。线上线下,众多公司纷纷涉足,有的是从产业端进入,有的则是从金融端切入。在这个庞大的体系中,供应商、核心企业、分销商、理销商以及最终用户构成了一个巨大的链条和网络。从中,我们可以提取出他们之间的上下游社交关系、同一层之间的社交关系,以及领域的垂直大模型。当我们深入到不同的核心企业行业时,还会遇到行业知识图谱关系,供应链上游的供需关系等。在这样的体系下,如何进行赋能成为了一个关键问题。这时,供应链风险的预测显得尤为重要。预测上下游哪个环节可能出现风险,如供货不及时等情况,对风险进行预测,同时我们也需要对上下游供需关系、采购销量的预测。因此,预测能力是智能风控能够赋能供应链风控体系的重要方面。此外,还存在大量的欺骗和欺诈行为需要识别,如上下游勾结的欺诈行为、同一链路上的财务及采购数据的造假和伪造行为。现在,越来越多的研究将企业风险放在一个网络上,针对供应链整个网络或担保关系网络上的风险传播进行研究。综上所述,随着供应链风控体系越来越智能化,为算法提供了巨大的发挥空间,同时也真正实现了金融赋能实体经济。本文整体介绍了智能风控的格局和发展趋势。相信未来会更加美好,人工和算法将相互融合,共同推动智能化的发展。
分享嘉宾
INTRODUCTION
汪浩然
互联网公司
资深风控和图计算专家
英国硕士,业内有算法百晓生和扫地僧之称,自幼好算法,遍干互联网诸侯,曾在蚂蚁金服,阿里巴巴,腾讯等公司主要从事风控算法,社交计算和图计算等工作,三十入风控,历抵圈内卿相,横跨金融,支付,电商,供应链,社区,社交等场景。率先工业界落地过诸多图上挖掘和机器学习算法。
点个在看你最好看
SPRING HAS ARRIVED